AI资讯新闻榜单内容搜索-Llama 3.1

Meta 的 Llama 3.1 可以回忆起第一本《哈利·波特》的 42%：新的研究可能对针对生成人工智能的版权诉讼产生重大影响

近年来，众多原告——包括书籍、报纸、计算机代码和照片的出版商——起诉人工智能公司使用受版权保护的材料来训练模型。所有这些诉讼中的一个关键问题是，人工智能模型如何轻易地从原告的受版权保护的内容中逐字摘录。

来自主题: AI资讯

9504 点击 2025-06-17 17:17

2024年11月，艾伦人工智能研究所（Ai2）推出了Tülu 3 8B和70B，在性能上超越了同等参数的Llama 3.1 Instruct版本，并在长达82页的论文中公布其训练细节，训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报

7932 点击 2025-02-05 16:54

刚刚，大模型竞技场榜单上再添一款国产模型——来自阿里，Qwen2.5-Max，超越了DeepSeek-V3，以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯

8959 点击 2025-02-05 11:19

因为 V3 版本开源模型的发布，DeepSeek 又火了一把，而且这一次，是外网刷屏。训练成本估计只有 Llama 3.1 405B 模型的 11 分之一，后者的效果还不如它。

来自主题: AI资讯

8724 点击 2025-01-09 09:31

Llamacoder是Claude Artifacts的开源实现。最大的亮点就是，左侧AI写代码，右侧实时渲染。之前给大家推荐过一个基于Claude做的，Llamacoder是用了Meta 的 Llama 3.1 405B 作为底层语言模型。

来自主题: AI资讯

8920 点击 2024-12-01 11:55

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。

来自主题: AI技术研报

12465 点击 2024-11-23 16:04

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。

来自主题: AI资讯

5563 点击 2024-10-08 17:20

小模型崛起了。

来自主题: AI资讯

11809 点击 2024-08-16 21:04

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

7389 点击 2024-08-16 14:49

TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。

来自主题: AI资讯

8923 点击 2024-08-13 17:07